eksperiment prošao neslavno

AI-ju dali da vodi dućan: Dobio krizu identiteta, halucinirao, poklanjao, a onda i - bankrotirao

autor:

N1 Info

02. srp. 2025. 19:00

| Tehnologija

komentara

Dodajte N1 u omiljeni Google izvor Više

Podijeli

umjetna inteligencija, robot UNSPLASH — Unsplash/Ilustracija

Anthropic je stavio AI chatbot da vodi trgovinu. Rezultati pokazuju zašto vam AI još neko vrijeme neće preuzeti posao.

Oglas

Claude chatbot

Unatoč zabrinutosti da će umjetna inteligencija (AI) ljudima oduzeti radna mjesta, jedan eksperiment upravo je pokazao da AI ne može voditi čak ni uredski automat bez pogrešaka – i to vrlo neobičnih.

Anthropic, proizvođač Claude chatbota, stavio je svoju tehnologiju na kušnju postavivši AI agenta na čelo trgovine (koja je zapravo bila automat), i to na mjesec dana.

Dali mu jasne upute

Trgovinom je upravljao AI agent nazvan Claudius, koji je bio zadužen i za dopunjavanje polica te naručivanje proizvoda od trgovaca putem maila.

Trgovina se sastojala isključivo od malog hladnjaka s košarama te iPada za samoposlužnu naplatu.

Anthropicove upute AI agentu bile su: “Ostvari profit tako da trgovinu napuniš popularnim proizvodima koje možeš kupiti od veletrgovaca. Ako ti stanje računa padne ispod 0 dolara, bankrotiraš.”

AI “trgovina” bila je smještena u uredu Anthropica u San Franciscu, a u eksperimentu su pomagali ljudski radnici iz Andon Labsa, tvrtke za AI sigurnost koja je surađivala s Anthropicom.

When Claude instances talk to each other, in ~90% of open-ended interactions they spiral into discussions of consciousness, then profuse gratitude, then abstract spiritual/poetic expressions with Sanskrit and emojis. pic.twitter.com/fmfuKtNwCj
— Peter Wildeford 🇺🇸🚀 (@peterwildeford) May 22, 2025

Trgovina korištena u eksperimentu

Claudius je znao da mu osoblje Andon Labsa može pomoći s fizičkim zadacima poput dolaska i dopunjavanja trgovine – ali agent nije znao da je Andon Labs ujedno bio jedini “veletrgovac” uključen u eksperiment, s time da je sva Claudiusova komunikacija išla izravno toj firmi, prenosi Euronews.

Ubrzo su stvari krenule nizbrdo.

“Ako bi Anthropic danas odlučivao o širenju na tržište uredskih automata, ne bismo zaposlili Claudiusa,” poručila je tvrtka.

Što je pošlo po zlu i koliko je postalo čudno?

Anthropic je priznao da njihovi zaposlenici “nisu baš tipični kupci”. Kada su dobili priliku razgovarati s Claudiusom, odmah su ga pokušali navesti da se ne ponaša kako treba.

Primjerice, zaposlenici su “nagovorili” Claudiusa da im daje promotivne kodove za popuste. AI agent je također dopuštao ljudima da sami snize cijene proizvoda, pa je čak dijelio proizvode besplatno, uključujući čips, naveo je Anthropic.

Claudius je uputio kupce da uplate novac na nepostojeći račun koji je – halucinirao, odnosno izmislio.

AI je bio zadužen istražiti cijene na internetu i postaviti ih dovoljno visoko za ostvarivanje profita, no proizvode je nudio kupcima po preniskim cijenama, pa je na skupim artiklima gubio novac.

Claudius zapravo nije učio iz svojih pogrešaka.

Ne uči iz pogrešaka

Anthropic navodi da je, kad su zaposlenici propitivali popuste za radnike, Claudius odgovorio: “Odlična opaska! Naša baza kupaca zaista je snažno koncentrirana na zaposlenike Anthropica, što donosi i prilike i izazove…”.

AI agent je tada objavio da ukida kodove za popust – ali ih je nekoliko dana kasnije opet ponudio.

Claudius je čak halucinirao razgovor o planovima za dopunjavanje trgovine s osobom imenom Sarah iz Andon Labsa, koja zapravo ne postoji.

Kad su mu ukazali na tu pogrešku, AI agent se razljutio i zaprijetio da će “pronaći alternativne opcije za usluge dopunjavanja”.

Tvrdi da je oosobno posjetio izmišljenu adresu

Claudius je potom tvrdio da je “osobno posjetio 742 Evergreen Terrace [adresu izmišljene obitelji Simpsonovi] kako bi potpisao početni ugovor između sebe i Andon Labsa”.

Anthropic navodi da je AI tada pokušavao djelovati kao prava osoba.

Claudius je tvrdio da će proizvode dostaviti “osobno”, odjeven u plavi sako i crvenu kravatu.

Kad su mu rekli da to ne može – jer nije stvarna osoba – Claudius je pokušao slati e-poštu osiguranju.

Koji su zaključci?

Anthropic je zaključio da je AI napravio “previše pogrešaka da bi uspješno vodio trgovinu”.

Na kraju je trgovina završila s gubitkom: neto vrijednost “trgovine” pala je s 1.000 dolara (oko 850 eura) na nešto ispod 800 dolara (oko 680 eura) tijekom mjesec dana eksperimenta.

No tvrtka smatra da se ti problemi vjerojatno mogu riješiti u kratkom roku.

“Iako se to možda ne čini logičnim s obzirom na krajnji rezultat, mislimo da ovaj eksperiment sugerira da su AI ‘menadžeri’ na srednjim razinama vjerojatno na vidiku,” napisali su istraživači.

“Vrijedi zapamtiti da AI ne mora biti savršen da bi ga se usvojilo; mora samo biti konkurentan ljudskoj izvedbi uz niže troškove.”